由于早期的机器学习模型,诸如准确性和精确度等指标已成为评估和比较训练模型的事实上的方法。但是,单个度量号并未完全捕获模型之间的相似性和差异,尤其是在计算机视觉域中。在某个数据集上具有很高精度的模型可能会在另一个数据集上提供较低的精度,而无需任何进一步的见解。为了解决这个问题,我们基于一种称为Disect的最新可解释性技术,以引入\ textit {模型可解释性},该技术根据他们所学的视觉概念(例如对象和材料)来确定模型如何相互联系或补充。为了实现这一目标,我们将13个表现最佳的自制模型投射到一个学习的概念(LCE)空间中,该概念从学识渊博的概念的角度揭示了模型之间的邻近。我们将这些模型的性能进一步跨越了四个计算机视觉任务和15个数据集。该实验使我们能够将模型分为三类,并首次揭示了不同任务所需的视觉概念类型。这是设计跨任务学习算法的一步。
translated by 谷歌翻译
通过丘陵形成的现场制备是一种常用的造林治疗,通过机械地创建称为丘的植物植物物质来改善树木生长条件。在现场准备之后,下一个关键步骤是计算土墩的数量,该堆积的数量为森林经理提供了对给定种植园块所需的幼苗数量的精确估计。计算土墩数量通常是通过林业工人的手动现场调查来进行的,林业工人昂贵且容易出错,尤其是在大面积地区。为了解决这个问题,我们提出了一个新颖的框架,利用无人机成像和计算机视觉的进步,以准确估计种植块上的土墩数量。提出的框架包括两个主要组件。首先,我们利用基于深度学习算法的视觉识别方法来通过基于像素的分割来进行多个对象检测。这使得可见的土墩以及其他经常看到的物体(例如树木,碎屑,水的积累)的初步计数可用于表征种植块。其次,由于视觉识别可能会受到几个扰动因子(例如丘陵侵蚀,遮挡)的限制,因此我们采用机器学习估计功能,该功能可预测基于第一阶段提取的局部块属性的最终数量。我们在新的无人机数据集上评估了所提出的框架,该数据集代表具有不同功能的众多种植块。所提出的方法在相对计数精度方面优于手动计数方法,表明它在困难情况下具有有利和有效的潜力。
translated by 谷歌翻译
作为反对攻击的最有效的防御方法之一,对抗性训练倾向于学习包容性的决策边界,以提高深度学习模型的鲁棒性。但是,由于沿对抗方向的边缘的大幅度和不必要的增加,对抗性训练会在自然实例和对抗性示例之间引起严重的交叉,这不利于平衡稳健性和自然准确性之间的权衡。在本文中,我们提出了一种新颖的对抗训练计划,以在稳健性和自然准确性之间进行更好的权衡。它旨在学习一个中度包容的决策边界,这意味着决策边界下的自然示例的边缘是中等的。我们称此方案为中等边缘的对抗训练(MMAT),该方案生成更细粒度的对抗示例以减轻交叉问题。我们还利用了经过良好培训的教师模型的逻辑来指导我们的模型学习。最后,MMAT在Black-Box和White-Box攻击下都可以实现高自然的精度和鲁棒性。例如,在SVHN上,实现了最新的鲁棒性和自然精度。
translated by 谷歌翻译
与诊断放射学相关的患者护理质量与医师工作量成正比。分割是诊断和治疗程序的基本限制前体。机器学习的进步(ML)旨在提高诊断效率,以用广义算法替代单个应用程序。在无监督的异常检测(UAD)中,基于卷积神经网络(CNN)自动编码器(AES)和变异自动编码器(VAE)被视为基于重建的异常分段的事实方法。在医学图像中寻找异常区域是使用异常分割的主要应用之一。 CNN中受限制的接收场限制了CNN对全局上下文进行建模,因此,如果异常区域涵盖了图像的一部分,则基于CNN的AES无法带来对图像的语义理解。另一方面,视觉变压器(VIT)已成为CNN的竞争替代品。它依赖于能够将图像斑块相互关联的自我发挥机制。为了重建一个连贯和更现实的图像,在这项工作中,我们研究了变形金刚在为基于重建的UAD任务构建AES的功能中。我们专注于用于大脑磁共振成像(MRI)的异常分割,并呈现五个基于变压器的模型,同时可以使分割性能可比或与最新模型(SOTA)模型相当。源代码可在github https://github.com/ahmedgh970/transformers_unsupervise_anomaly_segentation.git上获得
translated by 谷歌翻译
最近的研究表明,深度神经网络(DNNS)极易受到精心设计的对抗例子的影响。对那些对抗性例子的对抗性学习已被证明是防御这种攻击的最有效方法之一。目前,大多数现有的对抗示例生成方法基于一阶梯度,这几乎无法进一步改善模型的鲁棒性,尤其是在面对二阶对抗攻击时。与一阶梯度相比,二阶梯度提供了相对于自然示例的损失格局的更准确近似。受此启发的启发,我们的工作制作了二阶的对抗示例,并使用它们来训练DNNS。然而,二阶优化涉及Hessian Inverse的耗时计算。我们通过将问题转换为Krylov子空间中的优化,提出了一种近似方法,该方法显着降低了计算复杂性以加快训练过程。在矿工和CIFAR-10数据集上进行的广泛实验表明,我们使用二阶对抗示例的对抗性学习优于其他FISRT-阶方法,这可以改善针对广泛攻击的模型稳健性。
translated by 谷歌翻译
动态360 {\ Deg}沉浸视频中的突出人体检测(SHD)对于增强现实中的各种应用,各种应用是非常重要的。然而,由于缺乏具有大规模全向视频和丰富的注释,计算机视觉社区中,360 {\ DEG}视频SHD很少讨论。为此,我们提出了SHD360,这是第一个360 {\ DEG}视频SHD数据集,其中包含各种现实生活日常场景。由于到目前为止,没有提出360 {\ DEG}图像/视频SHD的方法,我们系统地基准于我们的SHD360上的11个代表性的最先进的突出物体检测(SOD)方法,并探索了从广泛的实验导出的关键问题结果。我们希望我们拟议的数据集和基准作为推进对360 {\ DEG}全景数据的以人为本的研究提供良好的起点。
translated by 谷歌翻译
在过去的几年中,已经提出了许多深度学习方法来解决从RGB图像分段突出对象的任务。然而,这些方法取决于单个模态,无法实现最先进的性能,以广泛使用的光场突出物体检测(SOD)数据集收集大规模的自然图像并提供多视图等多种模态,微镜头图像和深度图。最近提出的光场SOD方法已经获得了改善的检测精度,但仍然预测粗糙物体的结构并执行慢速推理速度。为此,我们提出了CMA-Net,其中包括两种小型级联的互感模块,旨在融合来自全体焦点和深度的方式的高级功能。我们提出的CMA-Net优于两个SOD方法,在两个广泛应用的光场基准数据集上。此外,所提出的CMA-Net能够以53 FPS的速度推断。广泛的定量和定性实验说明了我们CMA-Net的有效性和效率。
translated by 谷歌翻译
深度学习(DL)在许多与人类相关的任务中表现出巨大的成功,这导致其在许多计算机视觉的基础应用中采用,例如安全监控系统,自治车辆和医疗保健。一旦他们拥有能力克服安全关键挑战,这种安全关键型应用程序必须绘制他们的成功部署之路。在这些挑战中,防止或/和检测对抗性实例(AES)。对手可以仔细制作小型,通常是难以察觉的,称为扰动的噪声被添加到清洁图像中以产生AE。 AE的目的是愚弄DL模型,使其成为DL应用的潜在风险。在文献中提出了许多测试时间逃避攻击和对策,即防御或检测方法。此外,还发布了很少的评论和调查,理论上展示了威胁的分类和对策方法,几乎​​没有焦点检测方法。在本文中,我们专注于图像分类任务,并试图为神经网络分类器进行测试时间逃避攻击检测方法的调查。对此类方法的详细讨论提供了在四个数据集的不同场景下的八个最先进的探测器的实验结果。我们还为这一研究方向提供了潜在的挑战和未来的观点。
translated by 谷歌翻译
为了保持信息迹象并长大,婴儿大脑必须解决旧信息所在的问题以及如何索引新的问题。我们提出未成熟的前额定皮层(PFC)使用其在时间信号中检测分层模式的主要功能作为第二目的,以组织发展大脑本身中的皮质网络的空间排序。我们的假设是PFC以序数图案的形式检测时间序列中的分层结构,并在大脑的不同部分中使用它们来索引信息。从此,我们建议检测模式的这种机制参与大脑本身的序数组织发展;即,The Connectome的启动。通过这样做,它为语言准备好的大脑提供了用于操纵抽象知识和规划时间有序信息的工具;即,象征性思维和语言的出现。我们将审查可以支持此类机制并提出新的神经模型。我们将面对我们的思想,从发育,行为和大脑结果中的证据,例如,在镜子神经元系统的建造上进行一些假设,体现了认知,以及学习的能力。
translated by 谷歌翻译